% !Mode:: "TeX:UTF-8"
% !TEX encoding = UTF-8 Unicode

%----------------------------------------------------------------------------------------
% 机器翻译：统计建模与深度学习方法
% Machine Translation: Statistical Modeling and Deep Learning Methods
%
% Copyright 2020
% 肖桐(xiaotong@mail.neu.edu.cn) 朱靖波 (zhujingbo@mail.neu.edu.cn)
%----------------------------------------------------------------------------------------

\renewcommand\figurename{图}

%----------------------------------------------------------------------------------------
%	PREFACE
%----------------------------------------------------------------------------------------

{\color{white} 空}
\vspace{1em}
\begin{center}
{\Huge \bfnew{前\ \ \ \ 言}}
\end{center}
\vspace{2em}

\begin{spacing}{1.18}

本书全面回顾了近三十年内机器翻译的技术发展历程，并围绕{\sffamily\bfseries 机器翻译的建模}这一主题对机器翻译的技术方法进行了全面介绍。在写作中，笔者力求用朴实的语言和简洁的实例阐述机器翻译的基本模型，同时对相关的技术前沿进行讨论。其中也会涉及大量的实践经验，包括许多机器翻译系统开发的细节。从这个角度来说，本书不单单是一本理论书籍，它还结合了机器翻译的应用，给读者提供了很多机器翻译技术落地的具体思路。

本书可以供计算机相关专业高年级本科生及研究生学习之用，也可以作为自然语言处理领域，特别是机器翻译方向相关研究人员的参考资料。此外，本书各章的主题都十分明确，内容也相对集中。因此，读者也可将每章作为某一专题的学习资料。

{\sffamily\bfseries 用最简单的方式阐述机器翻译的基本思想}是笔者所期望达到的目标。但是，书中不可避免会使用一些形式化定义和算法的抽象描述，因此，笔者尽所能通过图例进行解释（截止目前本书共287张插图）。不过，本书所包含的内容较为广泛，难免会有疏漏，望读者海涵，并指出不当之处。

本书共分为四个部分，十八章。章节的顺序参考了机器翻译技术发展的时间脉络，同时兼顾了机器翻译知识体系的内在逻辑。本书的主要内容包括：

\begin{itemize}
\vspace{0.5em}
\item 第一部分：机器翻译基础
    \begin{itemize}
    \item 第一章\ 机器翻译简介
    \item 第二章\ 统计语言建模基础
    \item 第三章\ 词法分析和语法分析基础
    \item 第四章\ 翻译质量评价
    \end{itemize}
\vspace{0.5em}
\item 第二部分：统计机器翻译
    \begin{itemize}
    \item 第五章\ 基于词的机器翻译建模
    \item 第六章\ 基于扭曲度和繁衍率的模型
    \item 第七章\ 基于短语的模型
    \item 第八章\ 基于句法的模型
    \end{itemize}
\vspace{0.5em}
\item 第三部分：神经机器翻译
    \begin{itemize}
    \item 第九章\ 人工神经网络和神经语言建模
    \item 第十章\ 基于循环神经网络的模型
    \item 第十一章\ 基于卷积神经网络的模型
    \item 第十二章\ 基于自注意力的模型
    \end{itemize}
\vspace{0.5em}
\item 第四部分：机器翻译前沿
    \begin{itemize}
    \item 第十三章\ ？？？
    \item 第十四章\ ？？？
    \item 第十五章\ ？？？
    \item 第十六章\ ？？？
    \item 第十七章\ ？？？
    \item 第十八章\ ？？？
    \end{itemize}
\end{itemize}

\vspace{0.5em}

其中，第一部分是本书的基础知识部分，包含统计建模、语言分析、机器翻译评价等。在第一章对机器翻译的历史及现状进行介绍之后，第二章通过语言建模任务将统计建模的思想阐述出来，同时这部分内容也会作为后续机器翻译模型及方法的基础。第三章重点介绍机器翻译所涉及的词法和句法分析方法，旨在为后续相关概念的使用进行铺垫，同时进一步展示统计建模思想在相关问题上的应用。第四章相对独立，系统地介绍了机器翻译结果的评价方法，这部分内容也是机器翻译建模及系统设计所需的前置知识。

本书的第二部分主要介绍统计机器翻译的基本模型。第五章是整个机器翻译建模的基础。第六章进一步对扭曲度和产出率两个概念进行介绍，同时给出相关的翻译模型，这些模型在后续章节的内容中都有涉及。第七章和第八章分别介绍了基于短语和句法的模型。它们都是统计机器翻译的经典模型，其思想也构成了机器翻译成长过程中最精华的部分。

本书的第三部分主要介绍神经机器翻译模型，该模型也是近些年机器翻译的热点。第九章介绍了神经网络和深度学习的基础知识以保证本书知识体系的完备性。同时，第九章也介绍了基于神经网络的语言模型，其建模思想在神经机器翻译中被大量使用。第十、十一、十二章分别对三种经典的神经机器翻译模型进行介绍，以模型提出的时间为序，从最初的基于循环网络的模型，到最新的Transformer模型均有涉及。其中也会对编码器-解码器框架、注意力机制等经典方法和技术进行介绍。

本书的第四部分会进一步对机器翻译的前沿技术进行讨论，以神经机器翻译为主。该部分目前正在写作中，很快就会与读者见面。

%-------------------------------------------
\begin{figure}[htp]
\centering
\centering
\input{./ChapterPreface/Figures/figure-preface}
\end{figure}
%-------------------------------------------

\end{spacing}








